eDNA 上 监测 测序 数据 分 析 注 释 中 参考 数据 库 选 择 、 指 标 阅 值 选择 、 目 
标 数 据 准备 的 影响 一 一 以 长 江 中 游 鱼 类 为 监测 目标 * 


HZR 2， 杨 海 乐 1**， 刘 志 刚 1 杜 X 
(1. 中 国 水 产科 学 研究 院 长 江水 产 研究 所 ， 农 业 农 村 部 淡水 生物 多 样 性 保护 重点 实验 室 ， 湖 北 武汉 430223 
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摘 要 : 在 基于 宏 条 形 码 (metabarcoding ) 的 eDNA 监测 技术 路 径 中 ，eDNA 测序 数据 的 分 析 和 注释 是 决定 监测 结果 判断 和 评 
估 精 确 与 否 甚至 准确 与 否 的 基础 ， 而 参考 数据 库 选 择 、 指 标 阔 值 选择 、 目 标 数据 准备 是 eDNA 测序 数据 分 析 和 注释 中 最 为 关键 
的 3 个 技术 环节 。 为 型 清 上 述 3 个 技术 环节 处 理 方案 的 影响 ， 本 研究 以 长 江 中 游 2 组 eDNA 监测 COI 基因 测序 数据 为 分 析 对 
象 ， 针 对 鱼 类 的 检 出 做 了 3 组 实验 来 分 别 检验 1) 不 同 参考 数据 库 及 物种 注释 算法 对 注释 结果 的 影响 ，2) 不 同 OTU 聚 类 序列 
相似 度 和 物种 注释 分 类 置信 度 《〈 序 列 一 致 性 和 序列 覆盖 度 ) 对 注释 结果 的 影响 ，3 ) 目标 数据 中 各 物种 不 同 序列 丰富 度 对 注释 


结果 的 影响 。 结 果 显 示 : 1) Blast 算法 下 ，3 个 版 本 nt 库 注 释 出 的 物种 基本 一 臻 (72%~78%)，2 个 本 地 序列 参考 库 注释 出 的 物 
种 也 基本 一 臻 (91%~96%)， 这 5 个 序列 参考 库 注释 出 的 物种 52%~68% 一 致 ，nt 库 RDP Classifier 算法 注释 出 的 物种 覆盖 9596 


以 上 Blast 算法 注释 出 的 物种 , 并 比 Blast 算法 注释 出 的 物种 多 15196-44396, 多 出 的 物种 大 都 是 错误 注释 , 本 地 参考 数据 库 RDP 
Classifier 算法 注释 出 的 物种 覆盖 66%~85% 的 Blast 算法 注释 出 的 物种 ， 并 存在 数 条 只 注释 到 科 属 的 结果 。2) OTU RKF IJA 
ADU BUE, 取 值 0.999 比 取 值 0.99 获得 的 OTU 多 15496-20995, 注释 到 鱼 类 的 OTU 多 240%~490%; 注释 分 类 置信 和 度 闵 值 C Blast 
法， 序列 一 致 性 和 序列 覆盖 度 〉 从 0.8 到 0.99 注释 获得 的 物种 组 成 基本 (94% 以 上 ) 一 致 ， 物 种 下 的 OTU 组 成 也 基本 (83% 
以 上 ) 一 致 ， 注 释 分 类 置信 度 阔 值 取 0.7 时 注释 获得 的 物种 组 成 、OTU 组 成 和 取 0.8 及 以 上 时 注释 获得 的 有 较 大 差异 。3) 在 
OTU 聚 类 序列 相似 度 阔 值 0.999、 注 释 分 类 置信 度 阔 值 0.9 时 ， 多 序列 数据 注释 所 得 鱼 类 物种 数 、OTU 数 最 多 、 物 种 注释 正确 
率 最 高 ( 达 81.49%)， 分 别 比 单 序列 数据 的 多 7%、215% 和 高 5%。 在 具体 eDNA 测序 数据 的 分 析 和 注释 中 ， 可 通过 建立 完善 
本 地 参考 数据 库 、 优 化 OTU 聚 类 序列 相似 度 和 物种 注释 分 类 置信 度 〈 序 列 一 致 性 和 序列 覆盖 度 ) 取 值 、 增 加 目标 数据 的 丰富 
度 来 提高 注释 结果 的 准确 性 ， 但 受制 于 物种 注释 算法 的 局 限 性 ， 物 种 注释 错误 和 注释 遗漏 的 问题 可 能 将 长 期 存在 ， 物 种 注释 正 
确 率 通常 低 于 85% (基于 COT 基因 的 eDNA 监测 )。 
关键 词 : 环境 DNA， 鱼 类 ， 宏 条 形 码 ， 参 考 数据 库 ，OTU 聚 类 序列 相似 度 ， 物 种 注释 分 类 置信 和 度 ， 长 江 中 游 
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Abstract: In the meta-barcoding based eDNA monitoring technology, the analysis and annotation of eDNA sequencing data serve as the 
foundation for obtaining accurate and reliable monitoring results. The selection of reference databases, the determination of analysis & 
annotation indicator thresholds, and the preparation of target data are the most critical technical steps in eDNA sequencing data analysis 
and annotation. To clarify the impacts of these three technical aspects and provide scientific support for the standardization of eDNA 
monitoring technology, the current study used two sets of COI gene sequence data from eDNA monitoring in the middle reach of the 
Yangtze River as the analysis objects and designed three sets of experiments to test 1) the impacts of different reference databases and 
species annotation algorithms on the annotation results, 2) the impacts of different OTU clustering sequence similarity and species 
annotation classification confidence (sequence consistency and sequence coverage) on the annotation results, and 3) the impacts of 
different target sequence data richness of each species on the annotation results. The results showed that: 1) under the Blast algorithm, 
the annotated species matched with three versions of nt library from NCBI were generally consistent (7296-7896); those matched with 
two local sequence reference libraries were also generally consistent (9196-9696); and the annotated species from the five result matched 
with these five sequence reference libraries were consistent in 5296-6896. The RDP Classifier algorithm annotated species matched with 
nt libraries covered over 95% of Blast algorithm annotated species, and increased by 15196-44396 species, but most additional species 
were misannotated. The RDP Classifier algorithm annotated species matched with local sequence reference libraries covered 6696-8596 
of Blast algorithm annotated species, and there were several results only annotated to family or genus level. 2) When the OTU clustering 
sequence similarity threshold was set to 0.999, it obtained 15496-20995 more OTUs than when set to 0.99, and 24096-49096 more 
annotated OTUs of fish were obtained. The classification confidence threshold (Blast algorithm) had little effect on species composition 
when changed from 0.8 to 0.99, with over 9496 consistency, but there was a significant difference when it was set to 0.7. 3) When the 
OTU clustering sequence similarity threshold was 0.999 and the classification confidence threshold was 0.9, the number of fish species 
and OTUs obtained from multiple sequences data annotation was the largest, and had the highest species annotation accuracy (81.4994), 
which increased by 7% fish species, 215% OTUs and 5% accuracy respectively compared to single sequences data annotation. In eDNA 
sequencing data analysis and annotation, accuracy can be improved by establishing and improving local reference databases, op timizing 
OTU clustering sequence similarity and species annotation classification confidence thresholds (sequence consistency and sequence 
coverage), increasing target sequence data richness. However, due to the limitation of species annotation algorithms, problems such as 
species annotation errors and omissions may persist in eDNA sequencing data analysis and annotation in the future. Then, the species 
annotation accuracy of eDNA monitoring (based on the COI gene) would always lower than 8596. 

Keywords: environmental DNA; fish; meta-barcoding; reference database; OTU clustering sequence similarity; species annotation 


classification confidence; middle Yangtze River 


eDNA (environmental DNA) 是 指 从 环境 样品 (水体 、 土壤、 沉积 物 、 空 气 、 混合 物 等 ) 中 提取 的 DNA, 
是 各 种 生物 的 DNA 混合 物 [-3。 从 环境 样品 中 提取 eDNA， 用 特定 DNA 宏 条 形 码 (metabarcoding) 引 物 对 
其 进行 扩 增 测序 、 分 类 学 分 析 、 相 对 丰 度 分 析 、 功 能 预测 等 ， 可 以 监测 环境 中 物种 组 成 、 群 落 结构 、 生 态 
功能 等 相关 信息 83。 近 年 来 随 着 宏 条 形 码 技术 的 成 熟 、 二 代 测 序 技术 成 本 的 下 降 B，eDNA 监测 工作 有 向 
常态 化 发 展 的 趋势 加， 其 中 在 禁 捕 水 域 针 对 鱼 类 物种 组 成 及 资源 开展 eDNA 监测 的 需求 最 为 迫切 。 

实现 eDNA 监测 工作 常态 化 的 前 提 是 实现 eDNA 监测 的 标准 化 81, eDNA 监测 技术 链条 中 ，eDNA 
测序 结果 的 分 析 注 释 作 为 监测 工作 的 出 口 控制 环节 ， 是 整个 监测 工作 后 续 结果 判断 和 评估 的 基础 呈 ， 决 定 
了 监测 结果 判断 和 评估 的 精确 度 和 准确 度 。 参 考 数据 库 选 择 、 阅 值 指标 选择 、 目 标 数据 准备 是 eDNA 测 
数据 的 分 析 和 注释 中 最 为 关键 的 3 个 技术 环节 ， 其 重要 性 和 影响 已 有 整体 性 论述 B， 截 至 目前 的 案例 研究 
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也 都 有 自身 选择 (参考 数据 库 以 NCBI 的 nt 数据 库 为 主 9B3l， 小 部 分 进行 自 建 本 地 参考 数据 库 441，OTU 


聚 类 的 序列 相似 度 以 0.97、0.99 HEN, WAH 0.95、0.98、1.00 的 00,13， 物 种 注 


值 有 0.80、0.85、0.95， 序 列 一 致 性 取 
关 技 术 环 节 参 数 山 ， 我 们 随机 抽取 了 一 些 案 例 研 究 的 相关 参数 信息 于 附 表 1 中 )， 


peaa 


FE 释 中 的 序列 覆盖 度 取 


直 有 0.95. 0.96. 0.97. 0.99, 1.00110. 12.14; IRE ZRZPHESEAS ES HHTH 


比较 多 样 化 ， 结 果 瑟 


信和 度 、 可 比 性 存疑 ， 吸 需 标 准 化 。 但 若 要 满足 具体 的 标准 化 ， 尚 需 进行 具体 定量 比较 分 析 。 


针对 这 3 个 技术 环节 的 标准 化 需求 ， 本 研究 以 长 江 中 游 2 组 eDNA 监测 CO7 X 


姑 序 列 数据 为 分 析 对 


象 , 针对 鱼 类 的 检 出 做 了 3 组 实验 来 分 别 检 验 1) 不 同 参考 数据 库 及 物种 注释 算法 对 


注释 结果 的 影响 ，2) 


OTU 聚 类 序列 相似 度 和 物种 注释 分 类 置信 度 《〈 序 列 一 致 性 和 序列 覆盖 度 ) 对 注释 结果 的 影响 ，3 ) 目标 数 


据 中 各 物种 序列 丰富 度 对 注释 结果 的 影响 ， 并 探讨 其 中 的 影响 机 制 。 


1 材料 方法 
1.1 两 个 数据 集 的 来 源 


2020 年 6 月 在 长 江 中 游 段 设置 30 个 采样 断面 ， 相 邻 采 样 断面 间 的 径流 距离 为 30 km £A, RAT 


中 间 按 照 采样 断面 用 无 菌 采样 瓶 采 取 上 层 水 水 样 1.5L。 在 正式 采集 水 样 并 封装 之 前 , 用 所 要 采 的 水 测 洗 3 


次 。 水 样 在 冰 浴 中 暂 存 ， 在 实验 室 中 用 0.2 um 孔径 滤 膜 进行 抽 滤 〈 采 样 后 6 h 内 处 理 完毕 )， 获 得 存留 
了 eDNA 的 滤 膜 ， 放 入 50 mL 无 菌 离心 管 ， 自 封 袋 装 好 ，- 80C 冰 箱 保 存 ， 泡 沫 箱 干 冰 浴 运输 。 委 托 上 


海 美 吉 生 物 医药 科技 有 限 公司 用 线粒体 CO 基因 的 扩 增 子 ( 引 物 为 mlCOIintF/jgHCO2198R, 片段 长 度 320 
H 


bp 左右 ) 在 Illumina Miseq 平台 以 双向 测序 方式 进行 二 代 高 通 量 测序 ， 并 进行 双 端 序列 拼接 ， 获 得 长 江 


游 段 ADNA 数据 集 (51。2020 年 9 月 在 长 江 武汉 段 的 1 个 采样 断面 连续 13 天 采集 eDNA 样品 并 送 样 测 序 ， 


牛 夹 中 (项 目 编号 : CNP0002410, DOI: 10.26036/CNP0002410). 
1.2 本 地 参考 数据 库 的 构建 


根据 “长 江 渔 业 资 源 与 环境 调查 〈2017-2021)” 所 整理 出 的 长 江 鱼 类 名 录 071， 在 NCBI 数据 库 中 搜集 


体 采 样 、 测 序 方法 同上 ， 获 得 长 江 武 汉 段 eDNA 数据 集 09。 相 关 序 列 原始 数据 已 存 于 国家 基因 库 生命 


大 数据 平台 (China National GeneBank DataBase, CNGBdb, https://db.cngb.org/) 的 长 江 中 游 eDNA 序列 文 


各 物种 的 线粒体 COI 基因 序列 ， 并 基于 2021 年 在 长 江 渔业 资源 与 环境 调查 中 所 捕捞 采集 的 各 种 鱼 类 的 鱼 
条 样品 ， 通 过 DNA 提取 、 用 线粒体 CO 基因 的 宏 条 形 码 引物 mlCOIintF/gHCO2198R 进行 PCR 扩 增 、 


送 武汉 天 一 辉 远 生 物 科 技 有 限 公司 进行 序列 测定 ， 获 得 相关 鱼 类 物种 的 线粒体 CO 


序列 ， 整 合 构建 本 地 


针对 长 江 鱼 类 的 线粒体 CO 基因 的 宏 条 形 码 引 物 mlCOIintF/jgHCO2198R 参考 数据 库 。 共 收集 到 隶属 于 
18 H 41 fL 1495 属 281 种 的 2040 条 线粒体 CO 序列 〈 附 表 2)， 其 中 从 NCBI 搜集 获得 236 个 物种 共 1744 
条 序列 (截至 2022 年 3 月 )， 自 行 扩 增 、 测 序 获得 115 个 物种 共 296 条 序列 【金山 文档 】 长 江 鱼 类 COI 


基因 条 形 码 -持续 更 新 https:/kdocs.cnlycgi2zpUmWHas )。 用 所 收集 到 的 所 有 参考 序列 ( 共 281 种 2040 条 ) 


构建 本 地 多 序列 参考 库 ， 从 本 地 多 序列 参考 库 中 对 每 一 个 物种 随机 抽取 一 条 参考 序列 ( 共 281 种 281 条 ) 


构建 本 地 单 序列 参考 库 。 
1.3 不 同 参 考 数 据 库 及 物种 注释 算法 的 注释 结果 比较 分 析 


利用 美 吉 生 物 云 平台 Cwww.majorbio.com) 的 分 析 计 算 模 块 ， 对 长 江 中 游 段 eDNA 监测 COI 数据 、 
长 江 武 汉 段 DNA 监测 COI 数据 进行 质 控 、 拼 接 ( 用 FLASH version 1.2.11 
https://ccb.jhu.edu/software/FLASH/index.shtml)、OTU 聚 类 (用 USEARCH7-uparse http://drive5.com/uparse/， 


取 99% 的 序列 相似 度 )、 物 种 注释 (用 Blast 算法 ，RDP Classifier 


https:;//sourceforge.net/projects/rdp-classifier/). LA NCBI 核酸 序列 数据 库 nt v20200604. nt v20210917 Æ, 


算法 version 2.11 


nt v20221012 库 、 本 地 多 序列 参考 库 、 本 地 单 序列 参考 库 为 参考 数据 库 ， 采 用 Blast 算法 和 RDP Classifier 
算法 取 90% 的 分 类 置信 和 度 Blast 算法 中 为 序列 一 致 性 和 序列 覆盖 度 阔 值 均 取 90960. 进行 物种 注释 ， 获 得 
注释 结果 ， 筛 选 出 辐 鳍 鱼 纲 (Actinopteri〉 结 果 ， 最 后 进行 基于 不 同 参 考 数据 库 所 获得 注释 结果 〈 鱼 类 物 
种 数 、 鱼 类 物种 组 成 、 鱼 类 OTU ZO 的 比较 分 析 。 由 于 美 吉 生 物 云 平 台 202 年 更 新 ， 对 nt 库 不 再 提供 
RDP Classifier 算法 注释 的 分 析 接口 , 故 未 对 基于 nt v20221012 库 的 物种 注释 进行 RDP Classifier 算法 注释 
的 分 析 。 
1.4 不 同 OTU 聚 类 序列 相似 度 和 物种 注释 分 类 置信 和 度 的 注释 结果 比较 分 析 

基于 OTU 聚 类 序列 相似 度 和 物种 注释 分 类 置信 度 的 取 值 规则 及 常用 取 值 ,对 OTU 聚 类 序列 相似 度 和 
物种 注释 分 类 置信 度 (用 Blast 算法 , 即 序列 一 致 性 和 序列 覆盖 度 , 两 者 取 同 一 个 值 ) 取 值 设 定 14 个 组 合 ， 
unoise3 & 0.99, unoise3 & 0.9. unoise3 & 0.8、unoise3 & 0.7、0.999 & 0.99. 0.999 & 0.9、0.999 & 0.8. 0.999 
& 0.7. 0.99 & 0.97. 0.99 & 0.9. 0.99 & 0.8. 0.99 & 0.7, 0.97 & 0.8. 0.9 & 0.8， 对 长 江 中 游 段 eDNA 监测 
COI 数据 、 长 江 武汉 段 eDNA 监测 COI 数据 进行 分 析 注 释 ， 参 考 数据 库 用 NCBI 核酸 序列 数据 库 的 
nt v20221012 库 ， 获 得 注释 结果 ， 筛 选 出 辐 鳍 鱼 纲 CActinopteri). 结果 ， 进 行 不 同 阔 值 取 值 所 获得 注释 结 
果 〈 鱼 类 物种 数 、 鱼 类 物种 组 成 、 鱼 类 OTU 数 、 获 得 物种 注释 的 OTU 比例 ) 的 比较 分 析 。 分 析 计 算 平台 、 
模块 、 步 又 见 1.3。 
1.5 目标 数据 中 各 物种 不 同 序 列 丰 富 度 的 注释 结果 比较 分 析 

基于 本 地 单 序列 参考 库 、 本 地 多 序列 参考 库 分 别 构建 2 个 目标 数据 。 考虑 到 在 分 析 计 算 步 又 中 的 OTU 
聚 类 环节 默认 去 除 无 重复 序列 ， 所 以 在 构建 目标 数据 过 程 中 对 参考 序列 进行 7 倍 重复 。OTU 聚 类 序列 相 
似 度 和 物种 注释 分 类 置信 度 《〈 用 Blast 算法 ， 即 序列 一 致 性 和 序列 覆盖 度 ， 两 者 取 同 一 个 值 ) 取 值 设 定 4 
个 组 合 ，0.999 & 0.99, 0.999 & 0.9. 0.99 & 0.9. 0.99 & 0.8， 对 2 个 目标 数据 进行 物种 注释 ， 参 考 数据 库 
用 NCBI 核酸 序列 数据 库 的 nt v20221012 库 ， 获 得 注释 结果 ， 算 选 出 辐 鳍 鱼 纲 (Actinopteri) 结 果 ， 进 行 不 
司 目标 数据 所 获得 注释 结果 〈( 鱼 类 物种 数 、 鱼 类 物种 组 成 、 鱼 类 OTU 数 、 物 种 正确 注释 比例 ) 的 比较 分 
打 。 分 析 计 算 平 台 、 模 块 、 步 又 见 1.3。 
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2 结果 
2. 参考 数据 库 及 物种 注释 算法 对 注释 结果 的 影响 

针对 长 江 中 游 段 eDNA 监测 COI 数据 、 长 江 武 汉 段 eDNA 监测 CO 数据 这 2 个 数据 集 进行 的 3 个 nt 
参考 数据 库 Blast 算法 注释 结果 比较 分 析 显 示 ，3 个 nt 参考 数据 库 注释 到 的 鱼 类 物种 数 、 鱼 类 物种 组 成 、 
鱼 类 OTU 数 差异 不 大 (图 1, 附 图 la,b)。 长 江 中 游 段 注 释 到 的 鱼 类 物种 数 为 27~29、 鱼 类 OTU 数 为 47~48 
(图 1), 共 涉 及 鱼 类 物种 35 个 , 其 中 共有 的 物种 21 个 , 注释 结果 的 物种 组 成 一 致 性 可 达 72%( 附 图 la). 
长 江 武 汉 段 注释 到 的 鱼 类 物种 数 为 32~34、 鱼 类 OTU 数 为 95 (图 1)， 共 涉及 鱼 类 物种 41 个 ， 其 中 共有 
的 物种 25 个 ， 注 释 结果 的 物种 组 成 一 致 性 可 达 78%〈 附 图 lb )。 

针对 2 个 数据 集 进行 的 2 个 本 地 参考 数据 库 Blast 算法 注释 结果 比较 分 析 显 示 ， 多 序列 参考 库 和 单 序 
列 参 考 库 注释 到 的 鱼 类 物种 数 、 鱼 类 物种 组 成 、 鱼 类 OTU 数 基 本 一 致 〈 图 1， 附 图 la，b)。 长 江 中 游 段 
注释 到 的 鱼 类 物种 数 为 25、 鱼 类 OTU 数 为 44 (图 1)， 共 涉及 鱼 类 物种 26 个 ， 其 中 共有 的 物种 24 个 ， 
注释 结果 的 物种 组 成 一 致 性 可 达 96% CERES 1a)。 长 江 武 汉 段 注释 到 的 鱼 类 物种 数 为 31~32、 鱼 类 OTU 数 
为 93~94《〈 图 1)， 共 涉及 鱼 类 物种 34 个 ， 其 中 共有 的 物种 29 个 ， 注 释 结果 的 物种 组 成 一 致 性 可 达 91% 

( 附 图 1b)。 
比较 分 析 2 个 数据 集 的 3 个 nt 参考 数据 库 和 2 个 本 地 参考 数据 库 Blast 算法 注释 结果 , nt 参考 数据 库 


和 本 地 参考 数据 库 兴 
( 附 图 la, b). KA 


fü 
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( 附 图 lb )。 
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鱼 类 OTU 数 为 46~192 ( 
物种 中 的 16 NF 
算法 注释 到 的 鱼 类 物种 数 为 24~32、 鱼 类 OTU 数 为 65~291 (图 1), 


种 21 个 , 履 亲 Blast 算 法 注释 出 的 29 个 共有 物种 中 的 19 个 和 34 个 所 涉 


[中 游 段 用 3 个 nt 2253 
鱼 类 物种 数 为 1 5， 注释 结果 的 物种 组 成 一 致 性 约 52%〔( 附 图 la) KA 
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E 释 到 的 鱼 类 物种 数 、 鱼 类 OTU 数 差异 不 大 《 医 
虽 库 和 2 个 本 地 参考 数 扩 
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鱼 类 物种 数 为 134~135、 鱼 类 OTU 数 为 189 (B 
t 有 物种 和 35 个 所 涉 物种 
的 鱼 类 物种 数 为 88~89、 鱼 类 OTU 数 为 159~165 ( 
覆盖 Blast 算法 注释 出 的 所 有 25 个 共有 物种 和 41 个 所 涉 物种 中 的 39 个 ， 覆 盖 率 可 达 9596 CIR] lb )。 
EJE RDP Classifier 算法 注释 结果 ， 
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1)， 共 涉及 鱼 类 物种 28 个 ， 其 中 共有 物种 18 ^^, Zins Blast 算法 注释 出 的 24 
P 的 22 个 ,覆盖 率 约 67%~859%( 附 图 120 K 
tk 涉 及 鱼 类 物种 35 个 ， 划 
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( 附 图 1b). RDP Classifier 算法 下 ， 多 序列 参考 库 注释 出 的 鱼 类 物种 数 、OTU 数 明显 比 单 序列 参考 库 注 
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到 1 不 同 版 本 nt 参考 数据 库 、 本 地 参考 库 及 相应 注释 算法 对 注释 结果 的 影响 


Fig. 1 The influence of different visions of nt reference database from NCBI and of local reference databases and 


of annotation algorithms on annotation results 
ik: LSS， 本 地 单 序列 ，LMS， 本 地 多 序列 


Notes: LSS, local single-sequence; LMS, local multi-sequence 
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盖 度 , 两 者 取 同 一 个 什 
所 获得 的 OTU 数量 越 多 
的 OTU 比例 越 低 )， 但 如 
OTU 数 也 差异 不 大 ， 而 物种 注释 分 类 
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Fig. 2 The influence of different OTU cluster sequence similarity and different species annotation classification 


confidence on annotation results 
ik: 物种 注释 分 类 置信 度 ， 在 Blast 算法 中 为 序列 一 致 性 和 序列 覆盖 度 ， 两 者 取 同 一 个 值 。 


Notes: In the Blast algorithm, the classification confidence of species annotation refers to the sequence similarity 


and sequence coverage, both of them take the same value. 
2.3 目标 数据 中 各 物种 序列 丰富 度 对 注释 结果 的 影响 
基于 本 地 单 序列 参考 库 、 本 地 多 序列 参考 库 所 构建 的 2 个 目标 数据 开展 的 OTU 聚 类 和 物种 注释 分 析 
对 比 结果 显示 ， 在 不 同 分 析 注 释 参 数 条 件 下 均 呈 现 出 ， 目 标 数 据 中 各 物种 的 序列 丰富 度 越 高 ， 注 释 所 得 的 
物种 数 越 多 、OTU 数 越 多 ， 物 种 正确 注释 比例 越 高 〈 图 3)。 同 时 ， 结 果 也 验证 了 在 对 不 同 物种 丰富 度 下 
的 目标 数据 注释 过 程 中 ，OTU 到 类 序列 相似 度 越 高 ， 所 获得 的 OTU 越 精细 ，OTU 数量 也 越 多 ， 注 释 所 得 


的 物种 也 越 多 ， 物 种 正确 注释 比例 越 高 (图 3 )。 
在 对 2 个 不 同 物种 丰富 度 的 目标 数据 注释 过 程 中 ，0.999 的 OTU 聚 类 序列 相似 度 、0.9 的 物种 注释 分 
类 置信 和 度 (Blast 算法 ， 序 列 一 致 性 和 序列 覆盖 度 ， 两 者 取 同 一 个 值 ) 均 获 得 了 最 高 的 注释 所 得 鱼 类 物种 
数 、 注 释 所 得 鱼 类 OTU 数 、 物 种 正确 注释 比例 (图 3)。 在 最 优 分 析 注 释 参 数 (0.999&0.90 条 件 下 ， 多 序 
列 数据 比 单 序列 数据 注释 所 得 鱼 类 物种 数 与 OTU 数 分 别 多 7% 和 215%, 物种 正确 注释 比例 高 约 4%( 图 3)。 
单 序列 数据 用 4 组 参数 注释 到 的 鱼 类 物种 (4 组 结果 ) 共 涉 及 258 种 ， 其 中 一 致 的 有 237 种 ; 多 序列 
数据 用 4 组 参数 注释 到 的 鱼 类 物种 (4 组 结果 ) 共 涉 及 296 种 ， 其 中 一 致 的 有 235 种 ， 单 序列 数据 和 多 序 
列 数据 用 4 组 参数 注释 到 的 鱼 类 物种 (8 组 结果 ) 共 涉 及 299 种 ,其 中 一 致 的 有 216 种 〈 附 图 3a)。 高 OTU 
聚 类 序列 相似 度 和 物种 注释 分 类 置信 度 的 结果 并 不 完全 对 低 OTU 聚 类 序列 相似 度 和 物种 注释 分 类 置信 度 
的 结果 构成 全 覆盖, 多 序列 数据 注释 所 得 结果 也 不 完全 对 单 序列 数据 注释 所 得 结果 构成 全 覆盖 ( 附 图 3a)。 
单 序列 数据 用 4 组 参数 一 共 正 确 注 释 到 鱼 类 220 种 ,其 中 4 组 参数 下 均 正确 注释 到 的 有 201 种 ; 多 序 
列 数据 用 4 组 参数 一 共 正 确 注释 到 鱼 类 235 种 ,其 中 4 组 参数 下 均 正确 注释 到 的 有 206 fh; 单 序列 数据 和 
多 序列 数据 用 4 组 参数 一 共 正 确 注释 到 鱼 类 236 种 ,其 中 2 组 数据 4 组 参数 下 均 正确 注释 到 的 有 189 种 ( 附 
3b)。 单 序列 数据 和 多 序列 数据 用 4 组 参数 注释 到 的 鱼 类 (8 组 结果 ) 中 有 15%~17% 的 鱼 类 物种 是 错误 
的 〈 附 图 3a，b)。 单 序列 数据 和 多 序列 数据 都 未 被 正确 注释 的 鱼 类 物种 均 为 本 研究 扩 增 获得 但 nt 数据 库 
中 没有 参考 序列 的 物种 〈 附 表 2， 附 图 3b )。 
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图 3 目标 数据 中 各 物种 序列 丰富 度 对 注释 结果 的 影响 
Fig. 3 The influence of different sequence richness of each species in target sequence data on annotation results 
注 : 物种 注释 分 类 置信 度 ， 在 Blast 算法 中 的 序列 一 致 性 和 序列 覆盖 度 ， 两 者 取 同 一 个 值 


Notes: In the Blast algorithm, the classification confidence of species annotation refers to the sequence similarity 


and sequence coverage, both of them take the same value. 


3 讨论 

物种 注释 的 Blast 算法 和 RDP Classifier 算法 因为 计算 逻辑 不 同 而 获得 不 同 的 物种 注释 结果 , 但 因为 指 
向 相同 的 目标 ， 所 以 最 符合 目标 的 物种 注释 结果 两 种 算法 均 可 获得 ， 并 且 RDP Classifier 算法 的 结果 可 以 
覆盖 Blast 算法 的 结果 ， 还 会 多 出 一 些 错误 匹配 的 物种 。Blast Cbasic local alignment search tool) 算法 是 基 
于 局 部 相似 性 然后 拓展 延伸 到 全 局 的 比 对 算法 ， 并 不 确保 能 够 找到 全 局 最 优 解 ， 但 所 找到 的 解 绝 大 多 数 解 
近乎 于 是 全 局 最 优 解 , 本 研究 中 参考 不 同 版 本 nt 库 注释 获得 的 结果 具有 72%~78% 的 一 致 性 ( 附 图 la,b)。 
RDP Classifier 基于 贝 叶 斯 原理 进行 分 类 ， 通 过 计算 后 先 验 概率 和 条 件 概率 并 用 Bootstrap 策略 计算 其 置 
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mk 


度 获 得 最 终 注 释 ， 结 果 基 本 上 能 够 覆盖 目标 结果 ， 但 同时 也 会 获得 一 些 非 目 标 结果 的 错误 注释 ， 本 研究 中 
RDP Classifier 算法 nt 库 注 释 获得 的 结果 可 履 盖 93% 以 上 的 Blast 算法 注释 获得 的 结果 , 同时 也 多 151%~343% 
的 物种 ， 多 出 的 大 都 (99%) 是 错误 注释 的 物种 〈 附 图 1a，b)， 类 似 结果 和 结论 在 先前 的 研究 中 已 有 提 及 
和 探讨 u6。 因 此 在 基于 CO7 基因 的 鱼 类 eDNA 监测 应 用 中 ,结果 的 注释 如 果 选 择 Blast 算法 ， 对 物种 注释 
结果 有 必要 保持 一 定 的 谨慎 ， 物 种 组 成 中 可 能 仅 有 70%~80% 是 确定 正确 的 ， 另 外 的 可 能 是 注释 错误 ， 也 
可 能 是 注释 遗漏 ， 如 果 选 择 RDP Classifier 算法 ， 对 物种 注释 结果 要 保持 更 大 的 谨慎 ， 可 能 大 部 分 物种 
(60%~80%) 都 是 错误 注释 的 ; 注释 过 程 中 如 果 参 考 数据 库 中 缺少 相关 物种 的 参考 序列 , 在 Blast 算法 下 ， 
相关 物种 的 目标 序列 会 归 为 s unclassified， 在 RDP Classifier 算法 下 ， 相 关 物 种 的 目标 序列 会 被 注释 到 近 
源 物种 或 者 相关 科 属 下 。 

在 Blast 算法 下 ， 参 考 数据 库 对 注释 结果 的 影响 主要 取决 于 参考 数据 库 内 的 物种 覆盖 度 和 种 内 变异 履 
盖 度 ， 参 考 库 对 目标 物种 的 覆盖 越 高 、 每 个 物种 的 参考 序列 越 丰 富 、 对 物种 内 序列 变异 覆盖 越 全 ，OTU 
比 对 脱 靶 的 概率 越 低 ， 能 够 比 对 得 上 的 OTU 数量 越 多 ， 所 得 注释 结果 也 越 全 面 ， 但 如 果 参 考 库 未 能 有 效 
履 盖 相关 物种 或 相关 物种 的 核 音 酸 序列 变异 ， 就 容易 导致 在 比 对 注释 过 程 中 部 分 OTU 的 脱衣 、 部 分 物种 
的 注释 遗漏 。 在 本 研究 中 ， 不 同 版 本 nt 库 注释 获得 的 物种 组 成 和 本 地 参考 数据 库 注 释 获 得 的 物种 组 成 在 
部 分 物种 上 具有 系统 性 差异 〈 附 图 1a，b)， 这 种 系统 性 差异 来 自 本 地 参考 库 和 不 同 版 本 nt 库 内 参考 序列 
物种 组 成 和 序列 变异 履 盖 度 的 系统 性 差异 。 长 江 记 录 有 鱼 类 458 种 (包含 外 来 种 ) L141， 其 中 222 种 鱼 类 在 
nt 库 中 缺少 线粒体 CO 基因 的 扩 增 子 〈 引 物 为 mlCOIintF/jgHCO2198R) 对 应 的 参考 序列 ， 部 分 有 参考 序 
列 的 物种 的 序列 数量 还 比较 少 ， 对 物种 内 的 核 昔 酸 变异 覆盖 有 限 〈 和 截至 2022 年 3 月 )， 这 导致 了 在 实践 应 
中 物种 数 正 确 检 出 的 偏 少 ， 以 及 各 物种 序列 相对 丰 度 和 实际 群落 结构 的 不 匹配 06 !8。 为 了 克服 nt 库 中 
参考 序列 的 不 足 ， 可 以 构建 本 地 参考 数据 库 , 快速 便捷 地 更 新 补充 相关 物种 的 参考 序列 ， 尽 可 能 全 面 地 覆 
盖 各 物种 的 种 内 变异 。 在 本 地 数据 库 构 建 方面 ， 南 京 农业 大 学 等 10 余 所 高 校 及 科研 院 所 合作 构建 的 中 国 
淡水 大 型 底 栖 无 状 椎 动物 条 形 码 数据 库 是 类 似 工作 的 先行 者 09]。 建 议 根据 长 江 鱼 类 名 录 [1， 整 合 NCBI 
的 nt 数据 库 中 己 有 的 相关 宏 条 形 码 参 考 序列 和 本 地 扩 增 获得 的 相关 宏 条 形 码 参考 序列 ， 建 立 动态 补充 的 
本 地 参考 数据 库 ， 以 尽 可 能 全 面 地 覆盖 本 地 物种 及 各 物种 内 的 核 昔 酸 序列 变异 。 本 研究 初步 构建 的 长 江 鱼 
类 条 形 码 本 地 参考 数据 库 以 所 有 人 可 访问 、 可 下 载 、 可 编辑 的 在 线 文 档 形 式 作为 共享 本 地 数据 库 供 各 相关 
研究 者 使 用 , 执行 CC-BY-4.0 协议 , 我 们 正 基 于 我 们 已 有 的 长 江 鱼 类 标本 库 持续 补充 各 长 江 鱼 类 的 参考 
列 ， 也 欢迎 各 相关 研究 者 对 相关 参考 序列 进行 持续 补充 。 

在 Blast 算法 下 ，OTU 聚 类 序列 相似 度 和 物种 注释 分 类 置信 度 取 值 建议 综合 考虑 物种 注释 结果 的 精准 
度 和 注释 结果 的 履 盖 度 。 OTU 聚 类 时 序列 相似 度 设置 越 高 , 聚 类 形成 的 OTU 就 越 精细 、 数 目 也 就 越 多 D。 
序列 比 对 注释 的 分 类 置信 度 设置 得 偏 低 , 往往 会 出 现 把 某 一 物种 的 序列 错误 匹配 到 序列 相似 的 另 一 物种 上 ; 
序列 比 对 注释 的 分 类 置信 度 设置 得 偏 高 , 往往 会 出 现 一 些 通 过 比 对 无 法 与 参考 数据 库 中 的 任 一 序列 形成 匹 
配 的 OTU 序列 Bl。 不 同类 群 物种 间 的 参考 序列 差异 程度 有 差异 ， 不 同 物 种 内 的 变异 程度 也 有 差异 ， 所 以 
在 OTU 聚 类 和 物种 注释 过 程 中 所 适宜 的 参数 设置 也 会 有 差异 20， 比 如 针对 细菌 的 线粒体 16S rRNA. 基因 
的 参数 取 值 〈 比 如 0.97 & 0.8 P0) 通常 低 于 针对 真 核 生物 的 CO 基因 的 参数 取 值 〈 比 如 0.99 & 0.97 095, 
本 研究 针对 鱼 类 (COI 基因 上 的 320 bp 大 小 的 片段 ) 的 2 个 数据 集 分 析 中 ， 在 OTU 聚 类 序列 相似 度 大 于 
等 于 0.99、 物 种 注释 分 类 置信 度 〈 序 列 一 致 性 和 序列 覆盖 度 ， 两 者 取 同 一 个 值 ) 大 于 等 于 0.8 时 ， 注 释 所 
得 OTU 数 和 物种 数 的 比值 大 于 1.5 2), OTU 能 够 反映 一 定 的 种 内 核 苷 酸 序列 变异 〈 附 图 2a，c)， 注 
释 所 得 OTU 数 和 物种 数 均 相 对 稳定 (图 20, 物种 注释 相对 一 致 (物种 组 成 一 致 性 可 达 88% 以 上 , 附 图 2a, 
c). 在 OTU 聚 类 序列 相似 度 为 0.999 时 , 注释 到 鱼 类 的 序列 数 比 为 0.99 及 以 下 时 少 76%~81%〔 附 图 2b, 


Eu 


Z 


E 


d); 在 OTU 聚 类 序列 相似 度 一 定时 ， 注 释 到 鱼 类 的 OTU 数 随 着 物种 注释 分 类 置信 度 的 升 高 而 降低 ， 


0.97~0.99 WT 
22%~54% 的 OTU 注释 率 ，0.8 的 物种 注释 分 类 置信 度 可 获得 46%~71% 的 OTU 3H 


PISKI eDNA 监测 数据 分 析 中 ， 结 果 的 尘 


寺 鱼 类 线粒体 


COI 基因 宏 条 


] 


核心 


类 序列 相似 度 在 0.9 
值 〈 或 者 一 大 一 4 
在 提高 参考 数据 库 中 各 4 
同时 ， 增 加 
而 的 物种 组 成 检 出 


9~0.999 间 取 人 


| 丰富 


(或 者 一 大 一 小 取 两 个 什 
\ 取 两 个 值 进行 计算 ， 然 后 对 结果 进 
M Amy 


p 


fT 


、 选 择 合 适 的 OTU 


综合 )。 


聚 类 序列 相 


E 释 分 类 置信 和 度 可 获得 6%~26% 的 OTU 注释 率 ，0.9 的 物种 注释 分 类 


信和 度 可 获得 


FE 释 率 〈 图 2)。 


AEE 


E 释 如 果 选 择 Blast 算法 ， 建 议 OTU 


进行 计算 ), 物种 注释 分 类 置信 度 在 0.9~0.99 


标 数据 的 了 


Lt Bi 


并 有 


E 富 度 〔 比 如 在 监测 采样 


HIN’ 


内 容 在 于 物种 检 出 , 无 论 是 通过 
的 各 物种 的 特定 变异 序列 都 能 够 获 
苷 酸 序列 变异 种 类 , 使 eDNA 所 | 


考 序列 上 ,都 能 够 实现 物种 检 出 的 


望 获得 更 准确 的 群落 结构 状况 。 


e Er 


时 空 差异 的 
TEKK 


jt 


4H 
F 


EA 


监测 到 


的 B 


注释 出 的 OTU 数 多 78996-21596, 4 


的 各 4 


考 序列 的 丰 


y 


可 匹配 的 参考 序列 ， 
斩 种 的 种 内 核 昔 酸 
。 本 研究 中 , 多 
为 种 注释 正确 


还 是 i 


能 多 的 
加 eDNA 


种 内 


变 


中 总 有 


序列 数 ] 


占 比 高 4% 左 右 ( 达 8 


的 目标 物种 存在 


j 


定 种 内 核 


酸 序列 变异 ， 


不 高 的 情况 下 ， 可 以 通 
在 的 物种 组 成 检 出 结果 ， 


过 增加 


标 数据 的 


同时 


zz 


晶 还 能 获得 更 


fA 


基于 宏 条 


Lh (meta-barcoding) 的 eDNA 


注释 可 能 存在 


FAK 


期 存在 


y 


序列 数据 和 多 


不 存在 某 个 4 


种 〈 附 表 2， 附 
勿 种 被 


a 


序列 数据 中 未 被 正确 注释 的 鱼 


H 


3b)， 说 明 在 参考 数据 库 


种 注释 分 类 


度 和 0.99、0.9 的 物种 六 
类 序列 相似 度 和 0.9、0.8 的 物种 汶 
说 明 在 单 次 计算 中 将 一 个 物种 的 序列 


响 。 


4 结论 


针对 鱼 类 的 eDNA 监测 中 ， 测 序数 据 (线粒体 COI X 
序列 片段 320bp ) 的 OTU RENE 0.99~0.999 间 取 OTU 


IARE (Blast 算法 ， 序 列 
HA 15% 以 上 的 错误 率 ，3% 以 上 的 遗 } 
算 存在 一 定 的 将 一 个 物种 的 序列 错误 匹配 
聚 类 序列 相似 度 和 0.99、0.9 的 物种 注释 分 类 置信 度 下 
的 OTU 聚 类 序列 相似 度 和 0.9、0.8 的 物种 注释 分 类 置信 度 下 和 


H 


其 它 物种 遮蔽 的 必然 性 。 


考 数 ] 
FE 富 度 (比如 增 


类 物种 均 为 本 下 


AH 


HE bs 
的 群落 结构 组 成 状况 。 
监测 技术 路 径 中 ， 受 
FE 释 错误 和 注释 遗漏 的 问题 。 


究 对 2 个 目 


比 单 序列 数据 注释 出 
1.49% 
中 库 里 的 参考 序列 对 
区 域 的 有 


5t 


扩 增 获得 但 


的 参考 上 


列 和 


hi 


在 0.999, 


0.99 


€ 


数据 中 的 
的 OTU 聚 类 请 


ZA 


致 性 和 序列 覆盖 度 ， 
局 率 〈 附 表 2， 附 


FE 释 分 类 置信 


参考 数据 库 


取 同一 个 值 )， 所 获 物种 组 成 中 可 能 仅 有 
中 的 物种 覆盖 度 和 


度 下 的 物种 正确 注 


P 


[| 


EF% HI 


Ho 
HAR 


E 释 分 类 置信 和 度 
匹配 到 其 


E 


L^ 


0 各 物种 种 


空 差异 性 


复 采 样 进而 增加 


的 物种 1 


大 


X 


3a，b)， 说 明 因为 算法 
其它 物种 的 参考 序列 上 的 概率 
的 物种 正确 注释 比 人 
TEE FAUCI 


物种 的 参考 序列 上 的 概率 还 受 目 


半空 


标 数 
nt 数据 库 中 没有 参考 请 


。 因 此 对 于 目标 


似 度 和 物种 注释 分 类 置信 
和 E 复 采样 )， 将 可 获 
成 的 eDNA 监测 层 
变异 , 使 eDNA 
所 监测 到 的 各 物种 
个 或 者 几 个 能 够 
的 物种 数 多 5%~7%， 


得 更 
面 来 讲 ， 
所 监测 到 
的 种 内 核 


匹配 到 参 


区 域内 


列 相 似 度 ，0.99、0.9 
者 取 同 一 个 值 ) KF, 8 


的 内 


关于 物种 注释 算法 ，eDNA 


昌 的 分 析 注 释 结果 


序列 一 致 时 ， 在 物种 注 5 


和 酸 序列 变异 的 覆盖 度 
性 重复 采样 ) 以 获得 更 全 


序列 物种 
显示 , 单 
列 的 物 


泽 过 程 中 


| 


. 08 的 物 


在 


个 注释 计算 结 
局 限 性 ， 单 次 计 


。 多 序列 数据 在 0.999 的 OTU 
为 81% 左 右 , 多 序列 数据 在 0.99 


WE 0.999 的 OTU 聚 类 序列 相似 
例 为 77% 左 右 ， 单 序列 数据 在 0.99 


的 OTU XX 


E 确 注释 比例 为 72% 左 右 ( 附 表 2, 附 
did) 


B. i 


图 3a, b), 
| 算 参 数 影 


的 扩 增 子 ， 引 物 为 mlCOIintF/jgHCO2198R， 


聚 类 序列 相似 度 人 


IT 


， 对 所 获 OTU | 


Blast 算法 


进行 参考 nt 库 的 物种 注释 ， 建 议 在 0.9~0.99 间 取 物种 注释 分 类 置信 和 度 (序列 


致 性 


和 序列 覆盖 度 ， 两 者 


标 数据 的 丰富 度 。 但 


70%~80% 是 确定 正确 的 。 为 了 提高 注释 
内 变异 覆盖 度 〈 建 立 完 善 的 本 地 参考 数 ] 


E 
结果 


RJE), 


的 正确 率 ， 可 以 提高 


增加 


标 


x 域 的 时 


3, H 
prd 


i TRA 


E 释 算法 


， Ħ 


单 次 计算 存在 


na 


E RE 


个 物种 


的 序列 错误 匹配 到 其 它 物 种 的 参考 序列 上 的 概率 ， 物 种 注释 错误 和 注释 遗漏 的 问题 可 能 将 长 期 存在 。 针 对 
基于 CO7 基因 的 鱼 类 eDNA 监测 中 ， 在 参考 数据 库 、 计 算 指标 阔 值 、 目 标 数据 合适 的 情况 下 ， 物 种 注释 
错误 的 比例 力求 控制 到 15% 以 内 ， 物 种 注释 遗漏 的 比例 力求 控制 在 3% 以 内 。 随 着 参考 数据 库 的 完善 、 计 
算 指 标 闵 值 的 优化 、 目 标 数 据 的 丰富 , 鱼 类 eDNA 监测 结果 的 物种 组 成 有 望 更 为 准确 地 反映 监测 江 段 实际 


鱼 类 物种 组 成 、 各 物种 序列 的 相对 丰 度 有 望 更 为 贴近 监测 江 段 实际 鱼 类 群落 结构 。 


H 


T 


à 


参考 文献 

[1] Taberlet P, Coissac E, Hajibabaei M, etal.. Environmental DNA. Molecular Ecology. 2012, 21(8): 1789-1793. 

[2] Pawlowski J, Apothéloz-Perret-Gentil L, Altermatt F. Environmental DNA: Whats behind the term? Clarifying the terminology 
and recommendations for its future use in biomonitoring. Molecular Ecology. 2020, 29(22): 4258-4264. 

[3] Hai Le Yang, Hui Zhang, Hao Du. A framework for standardizing the processes of eDNA monitoring and an accessible vision of 
the future. Journal of Lake Sciences. 2023, 35(1): 12-31. R, IKIE, FEX. eDNA 监 测 方法 标准 化 框架 及 未 来 图 景 . 湖泊 科 
学 . 2023, 35(1): 12-31.] 


[4] Deiner K, Bik H M, Michler E, et al.. Environmental DNA metabarcoding: Transforming how we survey animal and plant 

communities. Molecular Ecology. 2017, 26(21): 5872-5895. 

[5] Coble A A, Flinders C A, Homyack J A, et al.. eDNA as a tool for identifying freshwater species in sustainable forestry: A critical 

review and potential future applications. Science of the Total Environment. 2019, 649: 1157-1170. 

[6] Deiner K, Yamanaka H, Bematchez L. The future of biodiversity monitoring and conservation utilizing environmental DNA. 

Environmental DNA. 2021, 3(3): 3-7. 

[7] Dickie I A, Boyer S, Buckley H L, et al.. Towards robust and repeatable sampling methods in eDNA based studies. Molecular 

Ecology Resources. 2018, 18(5): 940-952. 

[8] Nicholson A, Mcisaac D, Macdonald C, et al.. An analysis of metadata reporting in freshwater environmental DNA research calls 

for the development of best practice guidelines. Environmental DNA. 2020, 2(3): 343-349. 

[9] Itakura H, Wakiya R, Yamamoto S, et al.. Environmental DNA analysis reveals the spatial distribution, abundance, and biomass of 

Japanese eels at the river-basin scale. Aquatic Conservation: Marine and Freshwater Ecosystems. 2019, 29(3): 361-373. 

[10] Hánfling B, Lawson Handley L, Read D S, et al.. Environmental DNA metabarcoding of lake fish communities reflects long-term 
data from established survey methods. Molecular Ecology. 2016, 25(13): 3101-3119. 

11]Nardi C F, Fernández D A, Vanella F A, et al.. The expansion of exotic Chinook salmon (Oncorhynchus tshawytscha) in the 
extreme south of Patagonia: an environmental DNA approach. Biological invasions. 2019, 21(4): 1415-1425. 

12] Chen J, Chen Z, Liu S, et al.. Revealing an invasion risk of fish species in Qingdao underwater world by environmental DNA 
metabarcoding. Journal of Ocean University of China. 2021, 20(1): 124-136. 

[13]Ito G, Yamauchi H, Shigeyoshi M, etal.. Using eDNA metabarcoding to establish targets for freshwater fish composition following 
river restoration. Global Ecology and Conservation. 2023, 43: e2448. 

14] Balasingham K D, Walter R P, Mandrak N E, et al.. Environmental DNA detection of rare and invasive fish species in two Great 


Lakes tributaries. Molecular Ecology. 2018, 27(1): 112-127. 


[15] Hai Le Yang, Lan Xin Xu, Qiong Zhou, et al.. Quantifying the spatial resolution of eDNA monitoring: a case study in Middle 


Yangtze River in mean-flow period. ChinaXiv. 2023(202303): 8735. R, VE2528, AR. eDNA I JUI A [8] 4 EE CA] 2 


法 研究 ， 以 长 江 中 游 平水 期 为 例 . ChinaXiv. 2023(202303): 8735.] 


[16] Hai Le Yang, Jin Ming Wu, Hui Zhang, et al.. Environmental DNA metabarcoding utilization efficiency in monitoring large river 
fish species composition: a case study in the Wuhan transect of the Yangtze River. Journal of Fishery Sciences of China. 2021, 
28(6): 796-807.[ 杨 海 乐 , REH, IKES. 大 型 河流 中 鱼 类 组 成 的 DNA 监 测 效率 :以 长 江 武汉 江 段 为 例 . 中 国 水 产科 学 . 2021, 
28(6): 796-807.] 


[17] Hai Le Yang, Li Shen, Yong Feng He, etal.. Status of aquatic organisms resources and their environments in Yangtze River system 


(2017-2021). Journal of Fisheries of China. 2023, 47(2): 3-30.[ 杨 海 乐 ， 沈 丽 ， 何 勇 凤 等 . 长 江水 生生 物资 源 与 环境 本 底 状 况 调 


Æ (2017-2021) . 水 产 学 报 .2023, 47(2): 3-30.] 

[18] Euclide P T, Lor Y, Spear M J, et al.. Environmental DNA metabarcoding as a tool for biodiversity assessment and monitoring: 
reconstructing established fish communities of north - temperate lakes and rivers. Diversity and Distributions. 2021, 27(10): 
1966-1980. 


[19] Meng Wang, Yi Yuan, Hai Yan Yu, et al. Construction of barcode library of freshwater macroinvertebrate in China. 


Environmental Monitoring of China. 2022, 38(1): 3644.[ 王 靖 ， 苑 艺 ， 于 海燕 等 中国 淡水 大 型 底 栖 无 将 椎 动物 条 形 码 数据 库 


构建 . 中国 环境 监测 . 2022, 38(1): 36-44.] 

[20] Yang H L, Du H, Qi H F, et al.. Effectiveness assessment of using riverine water eDNA to simultaneously monitor the riverine and 
riparian biodiversity information. Scientific Reports. 2021, 11(1): 24241. 

[21] Ren Z Wang F, Qu X, et al.. Taxonomic and functional differences between microbial communities in Qinghai Lake and its input 


streams. Frontiers in Microbiology. 2017, 8(2319): 2319. 


